📊Промт дня: быстрый разведочный анализ (EDA) нового датасета
Перед тем как приступить к построению моделей или визуализаций, важно понять, с какими данными вы работаете. Разведочный анализ (Exploratory Data Analysis, EDA) помогает выявить структуру, качество и ключевые особенности датасета — это фундамент любого проекта в области аналитики и машинного обучения.
Промт:
Выполни экспресс-EDA (Exploratory Data Analysis) на pandas DataFrame. Проанализируй следующие аспекты: • Определи типы переменных (числовые, категориальные и пр.). • Проверь наличие и долю пропущенных значений по столбцам. • Рассчитай базовые статистики (среднее, медиана, стандартное отклонение и т.д.). • Оцени распределения признаков и выдели потенциальные выбросы. • Сформулируй ключевые наблюдения и инсайты, которые могут повлиять на последующую обработку или моделирование данных.
🎯 Цель — получить общее представление о структуре, качестве и особенностях данных до начала построения моделей или визуализаций.
Поддерживается использование специализированных инструментов: 📝pandas_profiling / ydata-profiling — для автоматического отчета, 📝sweetviz — для визуального сравнения датасетов, 📝seaborn и matplotlib — для точечных визуализаций распределений и корреляций.
📊Промт дня: быстрый разведочный анализ (EDA) нового датасета
Перед тем как приступить к построению моделей или визуализаций, важно понять, с какими данными вы работаете. Разведочный анализ (Exploratory Data Analysis, EDA) помогает выявить структуру, качество и ключевые особенности датасета — это фундамент любого проекта в области аналитики и машинного обучения.
Промт:
Выполни экспресс-EDA (Exploratory Data Analysis) на pandas DataFrame. Проанализируй следующие аспекты: • Определи типы переменных (числовые, категориальные и пр.). • Проверь наличие и долю пропущенных значений по столбцам. • Рассчитай базовые статистики (среднее, медиана, стандартное отклонение и т.д.). • Оцени распределения признаков и выдели потенциальные выбросы. • Сформулируй ключевые наблюдения и инсайты, которые могут повлиять на последующую обработку или моделирование данных.
🎯 Цель — получить общее представление о структуре, качестве и особенностях данных до начала построения моделей или визуализаций.
Поддерживается использование специализированных инструментов: 📝pandas_profiling / ydata-profiling — для автоматического отчета, 📝sweetviz — для визуального сравнения датасетов, 📝seaborn и matplotlib — для точечных визуализаций распределений и корреляций.
The S&P 500 slumped 1.8% on Monday and Tuesday, thanks to China Evergrande, the Chinese property company that looks like it is ready to default on its more-than $300 billion in debt. Cries of the next Lehman Brothers—or maybe the next Silverado?—echoed through the canyons of Wall Street as investors prepared for the worst.
Among the actives, Ascendas REIT sank 0.64 percent, while CapitaLand Integrated Commercial Trust plummeted 1.42 percent, City Developments plunged 1.12 percent, Dairy Farm International tumbled 0.86 percent, DBS Group skidded 0.68 percent, Genting Singapore retreated 0.67 percent, Hongkong Land climbed 1.30 percent, Mapletree Commercial Trust lost 0.47 percent, Mapletree Logistics Trust tanked 0.95 percent, Oversea-Chinese Banking Corporation dropped 0.61 percent, SATS rose 0.24 percent, SembCorp Industries shed 0.54 percent, Singapore Airlines surrendered 0.79 percent, Singapore Exchange slid 0.30 percent, Singapore Press Holdings declined 1.03 percent, Singapore Technologies Engineering dipped 0.26 percent, SingTel advanced 0.81 percent, United Overseas Bank fell 0.39 percent, Wilmar International eased 0.24 percent, Yangzijiang Shipbuilding jumped 1.42 percent and Keppel Corp, Thai Beverage, CapitaLand and Comfort DelGro were unchanged.
Библиотека дата сайентиста | Data Science Machine learning анализ данных машинное обучение from de